ОБРАБОТКА ДАННЫХ


ОБРАБОТКА ДАННЫХ
- комплекс процедур, направленных на преобразование и обобщение данных социологического исследования. В отечественной социологии термин трактуется очень широко. Обычно к О.Д. относят процедуры проверки и кодирования заполненного инструментария, в том числе пропущенных значений; ввода данных в компьютер; проверки и исправления введенных данных; перекодировки и преобразования переменных; проверки репрезентативности выборки и, при необходимости, ее взвешивания; простейшие процедуры статистического анализа данных - построение распределений частот и таблиц сопряженности .

При любом способе сбора информации общим требованием является обязательная фиксация ее в документах. Если в исследовании одновременно используется несколько документов, из них после заполнения необходимо сформировать рабочие массивы. Материалы, относящиеся к одному респонденту, следует собрать в комплекты, контролируя полноту каждого комплекта. Одновременно производится проверка, кодирование и нумерация документов, причем всем документам, относящимся к одному респонденту, присваиваются одинаковые номера. Если для групп респондентов заполнены некоторые общие документы (например, карточка предприятия или семьи), в каждый вид индивидуального инструментария должен быть внесен общий идентификатор - предприятия, семьи, - который позволит в дальнейшем связать ответы респондента с характеристиками группы.

При проверке документов следует обращать внимание на принадлежность респондента к генеральной совокупности, полноту комплекта и полноту заполнения каждого документа, правильность заполнения инструментария. К типичным ошибкам заполнения инструментария относится наличие нескольких ответов там, где предусматривался только один, наличие нелегитимных пропусков, логические ошибки.

Кодированию, в первую очередь, подлежат открытые вопросы и пропущенные значения. В сложных случаях для открытых вопросов разрабатываются специальные кодификаторы. При кодировании пропущенных значений важно знать причину отсутствия ответа. Основные причины можно упорядочить по степени легитимности: 1) вопрос не относится к респонденту ("структурный пропуск"); 2) респондент не понимает вопрос, не знает ответа или не имеет сложившегося мнения; 3) респондент отказывается отвечать на вопрос, уклоняется от ответа; 4) ответа нет по неизвестной причине. Первые три вида пропусков следует считать легитимными. Структурные пропущенные значения обычно исключают из анализа соответствующего вопроса. Незнание ответа или отказ отвечать в некоторых случаях можно содержательно интерпретировать и использовать в анализе данных. Поэтому интервьюеры должны как можно более точно фиксировать причину пропуска. Отсутствие ответа по неизвестной причине не является легитимным и должно быть отнесено к категории серьезных ошибок интервьюирования.

Ввод данных в компьютер производится с помощью текстовых редакторов или, что предпочтительнее, специальных программ или подсистем для ввода и редактирования данных, которые имеются в большинстве программных статистических средств. Преимущество специального программного обеспечения состоит в том, что оно позволяет организовать контроль качества данных непосредственно в процессе их ввода. Это, в первую очередь, контроль соответствия диапазону допустимых значений, проверка логической совместимости ответов, следование процессу ввода логике анкеты (автоматизация структурных пропусков).

Проверка и чистка введенных данных заключается в нахождении и исправлении ошибок, не обнаруженных при вводе. На этом этапе основное внимание уделяется логическим ошибкам. Если качество ввода не контролировалось автоматически, следует также проверить введенные данные на принадлежность к диапазону допустимых значений.

Программное обеспечение обработки данных, в том числе наиболее популярный среди социологов статистический пакет SPSS , обычно предоставляет возможность хранить вместе с данными исследования и выводить на печать тексты вопросов анкеты и ответов на них. Как правило, это делается посредством присвоения "меток" переменным и их отдельным значениям. Задание таких меток также входит в число процедур О.Д.

Современная методология неукоснительно требует, чтобы инструментарий исследования был максимально удобным для заполнения и точного фиксирования информации, и чтобы ввод данных в компьютер, во избежание ошибок, производился в полном соответствии с заполненным документом. Это требование часто противоречит логике решения задачи или требованиям статистических методов анализа данных, поэтому, в случае необходимости, переменные должны быть перекодированы и преобразованы соответствующим образом.

Предварительная проверка репрезентативности выборки осуществляется по так называемым "контролируемым", например, социально-демографическим, показателям. При необходимости, выборка может быть взвешена ( Выборки взвешивание) с помощью весовых переменных, предусмотренных в большинстве статистических программах. При использовании методов случайной выборки дополнительный опрос отдельных групп респондентов не рекомендуется; изъятие из массива уже заполненных "избыточных" документов запрещено. Если выборка невелика, проверку распределения "контролируемых" показателей можно сделать вручную на этапе проверки заполнения инструментария.

Статистическая О.Д. предусматривает в первую очередь получение важнейших количественных характеристик выборки, одномерных распределений и всевозможных таблиц; расчет ошибок выборки по важнейшим показателям; оценивание характеристик генеральной совокупности; анализ связей между переменными, решение прикладных задач и проверку гипотез исследования. Это может потребовать применения достаточно сложных методов статистического анализа - корреляционного , регрессионного , дисперсионного , факторного , кластерного и других.

О.В. Терещенко


Социология: Энциклопедия. — Минск: Интерпрессервис; Книжный Дом. . 2003.

Смотреть что такое "ОБРАБОТКА ДАННЫХ" в других словарях:

  • обработка данных — Систематическое осуществление операций над данными. [ИСО/МЭК 2382 1] [ГОСТ Р 52292 2004] обработка данных Технологическая операция, в результате которой изменяет свое значение хотя бы один из показателей, характеризующих состояние данных (объем… …   Справочник технического переводчика

  • Обработка данных — процесс выполнения последовательности операций над данными. Обработка данных может осуществляться в интерактивном и фоновом режимах. По английски: Data processing Синонимы английские: Performing data См. также: Обработка данных Данные Финансовый… …   Финансовый словарь

  • Обработка данных — [data processing, information proces­sing] процесс приведения данных к виду, удобному для использования. Независимо от вида информации, которая должна быть получена, и типа оборудования любая система О.д. выполняет три основные группы операций:… …   Экономико-математический словарь

  • ОБРАБОТКА ДАННЫХ — (data processing, DP) Класс компьютерных операций, состоящих в манипулировании большими объемами информации. В бизнесе к таким операциям относят бухгалтерский учет, калькуляции платежных ведомостей и общую регистрацию поступающей информации.… …   Словарь бизнес-терминов

  • ОБРАБОТКА ДАННЫХ — ОБРАБОТКА ДАННЫХ, систематизированная последовательность операций, совершаемых с ДАННЫМИ, прежде всего в компьютере, для получения новой информации путем вычислений, пересмотра и уточнения имеющейся информации, хранящейся на магнитном или… …   Научно-технический энциклопедический словарь

  • обработка данных — 7.1.1 обработка данных: Систематическое осуществление операций над данными. (ИСО/МЭК 2382 1) [1] Источник: ГОСТ Р 52292 2004: Информационная технология. Электронный обмен информацией. Термины и определения …   Словарь-справочник терминов нормативно-технической документации

  • обработка данных — duomenų apdorojimas statusas T sritis automatika atitikmenys: angl. data handling; data processing vok. Datenbehandlung, f; Datenverarbeitung, f rus. обработка данных, f pranc. traitement de données, m; traitement de information, m; traitement… …   Automatikos terminų žodynas

  • обработка данных — duomenų apdorojimas statusas T sritis fizika atitikmenys: angl. data processing; handling of data vok. Datenverarbeitung, f rus. обработка данных, f pranc. traitement de données, m …   Fizikos terminų žodynas

  • Обработка данных — Возможно, эта статья содержит оригинальное исследование. Добавьте ссылки на источники, в противном случае она может быть выставлена на удаление. Дополнительные сведения могут быть на странице обсуждения. (25 мая 2011) На настоящий момент,… …   Википедия

  • ОБРАБОТКА ДАННЫХ — один из этапов социологич. исследования. Включает ряд компонентов, каждый из к рых требует решения организационных, технич., методич., а подчас и теоретич. проблем. Необходимо подчеркнуть взаимосвязь этапа О.д. с др. этапами исследования. Многие… …   Российская социологическая энциклопедия

Книги

Другие книги по запросу «ОБРАБОТКА ДАННЫХ» >>